|
1.
基于染色质免疫共沉淀的高通量测序数据集的 顺式调控模体发现算法
冯艳霞, 张志红, 张少强
计算机应用
2018, 38 (6):
1826-1830.
DOI: 10.11772/j.issn.1001-9081.2017112749
针对新一代测序(NGS)的染色质免疫共沉淀的高通量测序(ChIP-Seq)数据集的模体发现问题,提出一种基于费舍尔(Fisher)精确检验的模体发现算法——FisherNet。首先运用费舍尔精确检验计算所有
k长短序的
P值并筛选出模体的种子;然后,构建初始模体的位置赋权矩阵;最后,用位置赋权矩阵扫描所有
k长短序形成最终模体。通过小鼠胚胎干细胞(mESC)和红细胞、人类淋巴母细胞系的ChIP-Seq数据集以及ENCODE数据库的数据进行验证,结果表明所提算法精度和计算速度均高于其他常见的模体发现算法,并且能够发现超过80%的已知转录因子核心模体及其辅调控因子模体。该算法在保证高精度的同时可以应用到大规模测序数据集。
参考文献 |
相关文章 |
多维度评价
|
|